© 2023 Laurent Cassar. Tous droits réservés.
Sur une idée un peu farfelue
d’Oscar Logger
Formateur informaticien AFPA
Le code génétique est l'ensemble des règles permettant de traduire les informations
contenues dans le génome des cellules vivantes afin de synthétiser les protéines. Au
sens large, il établit la correspondance entre le génotype et le phénotype d'un
organisme. Ce code est élémentaire et est un langage de programmation génétique du
plus bas niveau car il il n’y a plus rien en dessous et repose notamment sur la
correspondance entre, d'une part, des triplets de nucléotides, appelés codons, sur
l'ADN (acide désoxyribonucléique) transcrit en ARN (acide ribonucléique) messager
et, d'autre part, les acides aminés protéinogènes incorporés dans les protéines
synthétisées lors de la phase de traduction de l'ARN messager par les ribosomes
utilisant les ARN de transfert correspondant à chaque acides aminés protéinogènes. À
quelques exceptions près, chaque codon correspond à un seul et unique acide aminé
protéinogène.
Phénotype = Facteurs intrinsèques + Facteurs extrinsèques
Génotype Facteurs environnementaux
Chaque acides aminés protéinogènes faisant partie de ce
code génétique étant codé par une combinaison de trois
nucléotides de quatre sorte (Adénine, Guanine, Thymine,
Cytosine), ce système de codage repose donc un système
de numération positionnelle en base quatre puisque nous
avons quatre symboles de base (A, G, T, C) pour composer
les codons (triplets) qui codent chaque acides aminés dans
l’ADN. Lors de la transcription de l’ADN en ARN la
Thymine étant remplacée par l’Uracile ce système utilise
donc les symboles (A, G, U, C).
Chaque codons étant donc composés de trois
symboles pouvant prendre quatre états différents, le
nombre de combinaisons possibles pour un codon est
donc de quatre puissance trois.
43=4x4x4=64 combinaisons possibles pour coder les acides
aminés par codon.
La correspondance entre codons d'ARN messager et acides aminés protéinogènes
est généralement présentée sous forme de tableaux associant chacun des 64
codons, ou triplets de quatre bases nucléiques possibles, avec l'un des 22 acides
aminés protéinogènes.
Nous voyons donc que plusieurs mêmes acides aminés sont codés plusieurs fois
par différents codons dans le tableau ci-contre et cela explique dons que certaines
mutations pouvant se produire n’engendreront aucun changement dans la
protéine synthétisée au final si celle-ci ne change pas l’acide aminé codé dans le
programme génétique et donc la séquence en acides aminés or cas spécial cela
changerait le site donneur d'épissage et provoquerait une délétion entière d'un
exon de la séquence peptidique, l'exon n'étant alors plus reconnu car le site
d'épissage a été muté. Une mutation synonyme désigne une mutation silencieuse
qui touche un exon, sans changer la séquence de la protéine.
Par extension, et de façon impropre, le grand public appelle parfois «code
génétique» ce qui est en fait le génotype d'une cellule, c'est-à-dire
l'ensemble de ses allèles.
L’ADN étant plus résistant souvent double brin et se
trouvant dans le noyau des cellules eucaryotes isolé du reste
de la cellule et hautement sécurisé il constitue le meilleur
choix de support de stockage pour le code source qui doit
préserver son intégrité à partir duquel est initié tout
processus de traduction en protéine mature et fonctionnelle,
mais est plus coûteux à produire puisque (double brin) mais
assurant une plus grande sécurité de l’information sur le
long terme qui dans le cas d’une lésion la cellule peut
utiliser l'information portée par le brin complémentaire
intact pour réparer la lésion grâce à des polymérases
spécifiques et restaurer l’intégri de l’information
génétique. De plus grâce à des protocoles de correction
d’erreurs certaines mutations spontanées peuvent être
rétrogradées.
Pour une plus grande souplesse d’utilisation en masse et une
durée de vie de quelques minutes dans le le cytosol de la
cellule l’ARN est quand à lui utilisé car monocaténaire
(simple brin) et moins coûteux à produire par la cellule.
Chaque nucléotides étant caractéri par une base azotée spécifique, l’information génétique est donc quantifiée
en nombre de bases donc en " kilobase " (kb) pour les molécules d’ADN et ARN monocaténaire (simple brin), et en "
kilo paires de base " (kpb) pour les molécules d’ADN bicaténaire (double brin).
Une fois un ARN messager sortie du noyau d’une
cellule eucaryote il ne peut plus y retourner pour
modifier l’ADN car l’espace noyau (kernel en
anglais) bénéficiant du niveau de privilège le plus
élevé (anneau de protection Ring 0 comme on
pourrait dire dans le secteur de l’informatique) est
un site hautement sécurisé et est séparé de l’espace
cytoplasmique (Ring 3 comme on pourrait dire
aussi) contenant les divers utilitaires, les organites
plus précisément effectuant les diverses tâches du
système cellulaire, et il faudrait pour le pirater une
rétrotranscriptase affin de rétrotranscrire l’ARN
en ADN, ainsi que d’autres étapes bien trop
complexes pour réintégrer la nouvelle séquence
d’ADN dans le génome ce qui constituerait alors
une thérapie génique.
Biosynthèse des protéines
Les gènes des chromosomes sont donc des programmes contenant les séquences de triplets de nucléotides
formant les codons qui eux servent à coder les différents acides aminés du code génétique qui est universel
et commun à tout les organismes vivant de la terre (micro-organismes, champignons, plantes & animaux).
L’assemblage de ces différents acides aminés en séquences spécifiques constituent les différentes protéines
qui assureront diverses fonctions comme des enzymes catalysant des réactions biochimiques, d’autres
servant de protéines de structures comme le collagène et l’élastine dans la peau, les tendons et ligaments
ou bien les fibres contractiles des tissus musculaires, et d’autres pouvant jouer le rôle d’hormones ainsi
que de transporteurs pour diverses molécules dans le corps.
Si l’information génétique contenue dans les chromosomes ne peut être modifiée au cours de la vie (sauf
cas de mutations spontanées), il existe également une seconde couche de contrôle, l’épigénétique qui est
modulable par des facteurs extrinsèques (l’environnement, l’hygiène de vie) qui peut être conservée sur
plusieurs générations et en partie transmissible par hérédité.
En résumé tous les organismes vivants de
notre monde (y compris les virus qui ne
sont pas des entités vivantes) sont donc
codés avec seulement quarte éléments de
base que sont les nucléotides :
-CGATpour l’ADN
-CGAUpour l’ARN